博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
解析煎蛋图片
阅读量:6876 次
发布时间:2019-06-26

本文共 1525 字,大约阅读时间需要 5 分钟。

hot3.png

from html.parser import HTMLParserclass my_html_parser(HTMLParser):    def __init__(self):        HTMLParser.__init__(self)        self.bprint = False        self.imgs = []    def handle_starttag(self, tag, attrs):        # print('start:<%s>' % tag)        self.bprint = False        if tag is not 'a':            img = ''            for (var, value) in attrs:                if var == 'href':                    img = value                if var == 'class' and value == 'view_img_link':                    # print('%s="%s"' %(var, value))                    self.bprint = True            if str(img).__len__() > 0 and self.bprint is True:                self.imgs.append(img)    def handle_startendtag(self, tag, attrs):        pass        # print('start_end:<%s>' % tag)    def handle_endtag(self, tag):        pass        # print('end:<%s>' % tag)    # def handle_data(self, data):    #     if self.bprint is True:    #         print('data:<%s>' % data)            # def handle_comment(self, data):            #     print('comment:<%s>' % data)            #            # def handle_entityref(self, name):            #     print('entityref:<&%s>' % name)            #            # def handle_charref(self, name):            #     print('charref:<&#%s>' % name)    def print_img(self):        for img in self.imgs:            print(img)if __name__ == '__main__':    parser = my_html_parser()    parser.feed('''            

Some html HTML tutorial...

END

''')

转载于:https://my.oschina.net/IzumiHoshi/blog/1143143

你可能感兴趣的文章
[转载] 财经郎眼20120416:中美制造业比较
查看>>
Go net - IPAddr & TCPAddr
查看>>
Acer Aspire V5-471G修复BIOS
查看>>
ONLYOFFICE历史版本功能的开发
查看>>
RHEL7.2集成安装Nagios4.2.1+Cacti0.8.8h+NPC2.0.4
查看>>
网站样式变黑白的办法
查看>>
360假冒发布系统补丁 微软官方或将介入调查
查看>>
iOS App 主题切换
查看>>
用实验来说明lib的概念及链接方式
查看>>
我的友情链接
查看>>
快速排序思想及实现
查看>>
jQuery事件--- event.preventDefault() 取消点击动作的默认导航行为
查看>>
Android Log日志
查看>>
Annotation(注解)代替配置文件
查看>>
Java异常分类及处理
查看>>
docker 安装ElasticSearch的中文分词器IK
查看>>
python-unittest
查看>>
CF889E Mod Mod Mod
查看>>
LC39 Combination Sum
查看>>
2019-05-21 SpringBoot集成UReport2
查看>>